草庐IT

java - 在 Java 中将数据从 CSV 解析为数组

全部标签

ruby-on-rails - 如何使用 ruby​​ 加速大型 CSV 的处理

对于一个项目,我需要解析一些非常大的CSV文件。一些条目的内容存储在MySQL数据库中。我正在尝试使用多线程来加快速度,但到目前为止,这只会减慢速度。我解析了一个CSV文件(最大10GB),其中一些记录(20M+记录CSV中的大约5M)需要插入到MySQL数据库中。为了确定需要插入的记录,我们使用Redis服务器和包含正确ID/引用的集合。由于我们在任何给定时间处理大约30个这样的文件,并且存在一些依赖关系,我们将每个文件存储在一个Resque队列中,并让多个服务器处理这些(优先级)队列。简而言之:classWorkerdefself.perform(file)CsvParser.ea

sql - 有人知道 Ruby SQL 解析器吗?

有人知道RubySQL解析器吗? 最佳答案 这是一个使用rparsec完成的SQL解析器的示例:http://docs.codehaus.org/display/JPARSEC/SQL+parser+in+rparsec 关于sql-有人知道RubySQL解析器吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/2488791/

ruby - 在 Ruby 中解析大文件的最快方法

我有一个大约150MB的简单文本文件。我的代码将读取每一行,如果它与某些正则表达式匹配,它就会写入输出文件。但是现在,遍历文件的所有行(几分钟)只需要很长时间,就像File.open(filename).eachdo|line|#dosomestuffend我知道循环遍历文件行需要一段时间,因为即使我对“#dosomestuff”中的数据不做任何操作,它仍然需要很长时间。我知道一些unix程序几乎可以立即解析这样的大文件(比如grep),所以我想知道为什么ruby​​(MRI1.9)读取文件需要这么长时间,有什么方法可以让它更快吗? 最佳答案

ruby-on-rails - 使用 Gerrit 部署 Ruby on Rails 数据库

我正在考虑在我的下一个项目中使用RubyonRails。了解Rails网站的部署很容易理解(听起来我会使用PhusionPassenger)但现在我正试图找出数据库。我看到很多关于“数据库迁移”的内容,它允许我使用ruby​​代码更新数据库。我还看到我被允许创建这些迁移的up和down变体。但是,我只能理解这是如何在一个方向上干净利落地工作的。想象一下,如果我突然说“颜色列不能为空”。因此,up将使其成为必需项并为所有NULL条目提供默认值。但是向下会做什么呢?如果您关心它与它的开始方式相同,则不能将默认值设置回NULL。这对于发布到生产环境来说并不重要。这可能只会在一个方向上完成(在

ruby-on-rails - 使用 API 获取数据时,最好将该数据存储在另一个数据库中,还是最好在需要时继续获取该数据?

这个问题在这里已经有了答案:CachingcallstoanexternalAPIinarailsapp(1个回答)关闭6年前。我正在使用TMDBapi来获取电影标题和发行年份等信息,但我想知道我是否需要创建一个额外的数据库来在本地存储所有这些信息,而不是继续使用api获取信息?例如,我是否应该创建一个电影模型并调用:film.title并通过这样做访问存储有标题的本地数据库,或者我调用:Tmdb::Movie.detail(550).title然后再调用一次api?

ruby - 我怎么知道 BigDecimal 是否解析失败?

我正在从csv导入数据,我需要将一些值转换为BigDecimal,如果无法解析则引发错误。根据测试,BigDecimal("invalidnumber")返回0的BigDecimal。这没问题,但有点乱,除了有效值为0...Float("invalidnumber")的行为不同并抛出异常...我目前的解决方案是:classStringdefto_bdbeginFloat(self)rescueraise"Unabletoparse:#{self}"endBigDecimal(self)endend我是否完全遗漏了什么? 最佳答案 在

ruby-on-rails - rake 数据库 :migrate not working on my postgres db

好的,所以我有一个Rails应用程序,我试图在postgres数据库上运行迁移,我通常使用mysql,一切都很好,但是当我运行命令时,我得到了这个rakedb:migrate(in/Users/tamer/Sites/my_app)/Users/tamer/.rvm/gems/ruby-1.9.2-p290@my_app/gems/activerecord-3.0.3/lib/active_record/connection_adapters/postgresql_adapter.rb:487:[BUG]Segmentationfaultruby1.9.2p290(2011-07-09

ruby - 如何使用 SASS 解析 .scss 文件中所有 CSS 选择器的列表?

我想以编程方式解析.scss文件以生成该文件中使用的选择器的平面列表,主要作为某些静态代码分析的基础。在SASS术语中,我正在寻找一种方法来获取给定.scss文件的所有Sass::Tree::RuleNode的列表。到目前为止,我正在使用Sass::Engine.for_file创建树。然后,根据文档,为了在各个节点上使用Sass::Tree::RuleNode.resolved_rules,我必须使用Tree::Visitors::Cssize。但是某处有一个(可能很简单的)错误。require'sass'sass_engine=Sass::Engine.for_file('file

ruby-on-rails - 我如何解析一个 Excel 文件,它会给我提供与视觉上完全一样的数据?

我正在使用Rails5(Ruby2.4)。我想阅读.xls文档,我想将数据转换为CSV格式,就像它出现在Excel文件中一样。有人推荐我使用Roo,所以我有book=Roo::Spreadsheet.open(file_location)sheet=book.sheet(0)text=sheet.to_csvarr_of_arrs=CSV.parse(text)但是,返回的内容与我在电子表格中看到的内容不同。例如,电子表格中的一个单元格有16:45.81当我从上面获取CSV数据时,返回的是"0.011641319444444444"如何解析Excel文档并准确获取我所看到的内容?我不在

ruby-on-rails - 我应该将我的数据库查询测试放在 Rails 中的什么位置?

我来自Spring/hibernate背景。我注意到Rails没有dao和服务层。这确实加快了开发速度,但有时我不知道将测试放在哪里。现在,我一直在将我的模型方法和验证测试放在主要模型规范中。这个文件已经相当大了。测试查询的“标准”位置在哪里?我可以想象自己制作了大量固定装置/虚拟数据以确保我的查询按预期工作(可能是一个更好的主意,因为我是Rails的新手)。这些对于基本模型逻辑和验证测试来说并不是真正需要的。如果您能提供一些关于将这些测试放在哪里的建议,使用rails测试查询的最佳方法(尤其是具有多个连接的查询!),也许还有一些基本准则,说明它与使用DBunit/spring进行测试